基于YOLOv3 与CRNN的中文自然场景文字检测与识别
(欢迎关注“我爱计算机视觉”公众号,一个有价值有深度的公众号~)
52CV君曾经分享过多篇关于文字检测与识别的文章:
华科白翔老师团队ECCV2018 OCR论文:Mask TextSpotter
华科新开源文本识别算法:ASTER与DeepLesion数据集百度云下载
OpenCV深度学习文本检测示例程序(EAST text detector)
AdvancedEAST高效场景文本检测(附Github地址)
ECCV18|这篇论文开源的车牌识别系统打败了目前最先进的商业软件(附Github地址)
(以上链接如果打不开,请进入“我爱计算机视觉”公众号查看本文原文)
基本都遵循“有价值有深度”的原则,希望它们能对大家真实的有帮助。
但以上文章及其对应的开源工程并没有专门针对中文自然场景文本检测与识别一整套解决方案的。检测是将文字从图像中定位出来,识别则是将其分类到特定字符。
对于那些在实际的工程项目中使用中文文字识别功能的朋友来说,则非常希望能有一套检测与识别功能均包含的开源库。
现在好了,Github上新出的OCR工程chineseocr就是这样的一套较好的整体解决方案。
该工程chineseocr使用今年新出的通用目标检测系统YOLOv3进行文本检测,使用华中科技大学白翔老师团队2015年的结合了CNN, RNN 与 CTC loss 的CRNN文本序列识别方案。请看chineseocr原作者给出的一些识别结果示例:
对于上面的印刷体文字的检测和识别还是很不错的!
对于想对文字识别尤其是中文识别有更深入了解和研究的朋友,我想紧跟前沿当然是非常好的,但系统的学习了解经典也是必不可少的,推荐你们购买清华大学丁晓青教授团队2017年出版的新书《文字识别:原理、方法和实践》。文字识别方向相关的书并不多,而这本书是该领域既全面又权威且最新的著作。
点击上面链接购买(如果不是在微信阅读本文,需要进入微信阅读本文才能看到链接及介绍),52CV君会获得一点佣金,也是对52CV君的一点小支持^_^,谢谢大家。
工程Github地址:
https://github.com/chineseocr/chineseocr
YOLOv3论文地址:
YOLOv3: An Incremental Improvement
https://arxiv.org/abs/1804.02767
CRNN论文地址:
An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition
https://arxiv.org/abs/1507.05717
(欢迎关注“我爱计算机视觉”公众号,一个有价值有深度的公众号~)
【本文由“我爱计算机视觉”发布,2018年09月15日】